Skip to content

基于决策树加快cms识别

字数
457 字
阅读时间
2 分钟
更新日期
10/6/2018

最近在写Aireye(全网网络资产收集系统),模仿zoomeye项目,但是指纹识别的时候如果用指纹库扫描,指纹越大,则效率会越慢。虽然在w11scan的项目中有通过正确率来拉取最高的指纹,但是依然没有解决该问题。

决策树

通过各自决策来增加该CMS的权值,当权值大于某个值时,即可判断该CMS。这样就解决了指纹越大,而效率越慢的问题了。

如何进行决策呢?先统一访问一次网站首页,先通过某些关键字或者正则增加权值。过滤一遍权值小的指纹,对剩下的指纹再次进行权值判断,此时可以访问一些地址然后通过hash、关键词、字符串等判断依据来增加权值。

比如一个emlog系统,通过观察会发现首页都存在content/templates 这样的关键字符,这就是权值增加的判断依据。

缺点

缺点也很明显,决策树需要基于一定规则来编写,需要对比多个网站的不同来寻找规则,这明显加大了操作的复杂度。

操作顺序

很显然,需要事先收集N多同类CMS的URL,这还是需要用常规方法收集。之后决策树可以用肉眼找到明显特征,或者用机器学习的方法计算概率,总之通过这一层的计算后,剩下的指纹识别步骤就变得很少了,大大加大了全网扫描的识别效率!

撰写